データサイエンスや機械学習の分野で研究・開発を行うためには、安定したプログラミング環境が欠かせません。 本資料では、次の2つのツールを導入していきます。
これらを組み合わせて使うことで、授業や研究だけでなく、業界でも通用する「プロフェッショナルな作業環境」を自分のPCに整えることができます。
下図が環境のイメージです。
1回この環境を完成させれば、卒業まで困ることはありません。頑張ってまいりましょう。ひとつだけ注意点をお伝えします。
ここで行う作業の後半では、「半角文字でコマンドを入力する」という慣れない操作を行うことがあります。この操作は煩雑に見えますが、最も簡単なやり方は、書かれいてるコマンドを慎重に選択→コピーして、ペーストする(貼り付ける)ことです。コピーとペーストはマウスやタッチバッドのの右クリックで実行できます。
Windowsでは通常クラウド同期機能の「One Drive」が動いています。また、ユーザー名に日本語や空白が含まれていることもあります。これらはインストール作業で原因不明のエラーの原因となります。
授業や研究などで、このような面倒かつ不明な障害を出来るだけ回避するため、これからMiniforgeをWindowsのルート(C:¥)直下に新しく作ったフォルダの中にインストールしていきます。その方法を説明します。
Windowsの画面下にある「🔍検索」フィールドに、半角小文字で
e と入力し、表示された候補の中から、エクスプローラ
Explorer をクリックして起動します。
エクスプローラの左側に多くの項目がありますが、下の方に🖥️ PCという項目とアイコンがあります。これをクリックします。
すると、右側の広いウィンドウに「ローカルディスク (C:)」というのが出現するはずです。ここはWindowsシステムやアプリ、ユーザー領域といったすべてのハードディスクの内容が保存されている「ルートフォルダ」と呼ばれているもので、「Cドライブ」と呼称することもあります。
これをダブルクリックすると、Cの中に含まれるフォルダ一覧が表示されます。何も表示されていない領域にマウスを移動して右クリックし、「新規作成
→ フォルダ」を選びます。
新しく作成されたフォルダが、インストール先になります。次の名前を入力してください:
miniforge3すぐ後の作業で、新しく作ったこのフォルダminiforge3にMiniforgeをインストールしていくので、確実に作ってください。
以上で準備は完了です!
SafariやChromeなどで、MiniforgeのWebサイト: https://conda-forge.org/download/にアクセスします。WindowsのアイコンのあるWindows用Miniforgeインストーラーをクリックしてダウンロードしてください。
最近のWindowsでは、あまり有名でないMiniforgeインストーラーをダウンロードすると、Windows Defender(Windowsが使うセキュリティ保護アプリ)が「このインストーラーは信頼できないので実行させません」などと強権を行使して妨害してくることがあります:
このままだとMiniforgeをインストールできないので、次の手順で対処します。
STEP 1: 上の画像で右端にある「⋯」という部分をクリックしてください。
STEP 2: 出現したウィンドウメニューの中から、保存を選択します。
STEP 3:すると、信頼できることを確認してくださいとかなんとか警告するウィンドウが現れるので、削除ボタンの下向き矢印をクリックして、「保持する」を選択します。
STEP 4:これで警告は消え、Miniforgeインストーラーが使えるようになりました。ファイルを開くをクリックして、インストーラーを起動します(少々時間がかかります)。
Miniforgeインストーラーが起動したら、[Next >]をクリックします。
次のライセンス同意画面では、[I Agree]をクリックします。
次の画面では、Just Me (recommended)にチェックが入っていることを確認して[Next >]をクリックします。
次の画面で、先ほど作成したインストール先フォルダを設定します(下図も参照)。Destination Folderに書かれている場所がインストール先フォルダの規定値ですが、日本語PCではトラブルが頻出してますので、変更します。[Brouwse]ボタンをクリックします。
[Browse]をクリックすると、手動でインストール先フォルダを選択するよう求められます。先ほど作成した、miniforge3というフォルダがローカルディスク(C)の下にあるはずなので、それをマウスで選択して、[OK]をクリックします(下図も参照)。
設定を終えると、Destination
FolderがC:¥miniforge3¥に変更されているはずです。
設定が変更されているのを確認したら、[Next >]をクリックします。
次に現れる画面は、Windowsインストール時のオプション機能です。下図に示したように、1・3・4番目のオプションにチェックを入れてください(必須。そして2番目には絶対チェックをいれない)。
[Install]をクリックして、インストールを開始します。
インストールには5-10分程度かかります。以下の2つの画像のようなウィンドウが表示されれば、インストールは完了です。
以上の作業で、MiniforgeはみなさんのWindowsにインストールされました!
ここまでの作業がうまくいかなかったり、途中でエラーっぽい症状が出て先に進めない場合、遠慮なく私の研究室までPCを持参してください。すぐに治して使えるようにします。
次は、Miniforgeを用いて、Pythonプログラミング環境の初期設定を行っていきます。
Miniforgeシステムをデータサイエンスに適したようにカスタマイズするには、Miniforgeプロンプト(以下、単に”プロンプト”と略称する)という、Windowsのコマンドプロンプトと外見の似たアプリを使います。このアプリを使ってプログラミング環境を整えていきます。
プロンプト上で動作し、Pythonプログラミング環境で必要なライブラリ・パッケージ群を準備したり整えたりするツールがconda(コンダ)です。
プロンプトにconda [ENTER]と入力し、プロンプトに下のようなメッセージが出力されることを確認しましょう。
さきほどインストールしたMiniforgeには、Pythonの機能を拡張するさまざまなライブラリが入っています。これらは日々、世界中に散在する開発者によって更新されていきます。よって、Miniforgeに含まれているライブラリも、最新のバージョンにしておく方がよいです。
そのために、次のコマンドをターミナルで実行します:
conda update -n base conda -yすると、たったいまインストールしたばかりのminiforgeに含まれるパッケージの中で更新されているものを検知し、最新のバージョンを自動的にダウンロード、インストールしてくれます。インストールには数分かかり、その間さまざまな出力がMiniforge
プロンプトを流れていきますが、アップデート作業が全部終わると、画面がクリーンアップされ、doneという表示がプロンプト最上部に表示されるはずです。
Miniforgeでは、Pythonの実行環境を「仮想環境」という”Pythonの利用が完結するエコシステム”単位で管理します。Miniforgeプロンプトの入力部に(base)というのが見えます。これはMiniforgeがインストールされたときに自動的に作成する”基本的な”仮想環境です。現在Miniforgeプロンプトは、Pythonのbaseという仮想環境の中で動いているのです。baseは、Miniforgeシステムの中で管理者的役割を担っている仮想環境です。
私たちはデータ分析などの用途にPython環境を整えていくわけですが、こんなときは新たに専用の仮想環境を作ることが奨励されています。
この授業だけでなく、その他のPythonを使う授業や来年度のゼミでの研究活動のために、新しい仮想環境を作成します。新しい仮想環境には名前をつけることができ、名前は何でもよいのですが、短く簡潔に「ds」と命名
します。データサイエンス(data
science)の略です。Pythonのバージョンは、主要なデータサイエンス・機械学習ライブラリの動作確認がある3.12とします。次のコマンドをプロンプトで実行してください:
conda create -n ds python=3.12 -yENTERして実行すると、多くの情報が出力されながら仮想環境 ds が作成されます。下図のような画面になったら、作成成功です。
上の画面の最後に指示があるようにプロンプトで次のコマンドを実行し、仮想環境 ds を有効化します:
conda activate dsプロンプトの入力行の先頭に(ds)が追加されます。現在このプロンプトはPythonの仮想環境「ds」を動かしているという意味です。
実際に、利用可能なPythonをチェックします。プロンプトにpython --version [ENTER]と入力してください。
(ds) ユーザ名@Mac名 Downloads % python --version
Python 3.12.11仮想環境「ds」では、Python 3.12.XX(XXはバージョン番号)が使えることが分かります。
仮想環境「ds」に、この授業やゼミで利用する、データサイエンス定番ライブラリをインストールします。次のコマンドをターミナルで実行してください。
conda install -y jupyterlab ipykernel numpy pandas matplotlib seaborn scipy scikit-learnたくさんのライブラリがすごい勢いで一括インストールされる様子を目にすると思います。終了まで10分程度かかります。プロンプトにdone(終了)というメッセージが表示されれば終わりです。ちなみにインストールしたのは、世界標準かつデータ分析を行う人なら、学生からプロフェッショナルを問わず、皆使っている有名なPythonライブラリです。
jupyterlab, ipykernel:Visual Studio
Codeエディタとの連携numpy, pandas:データ操作ライブラリmatplotlib, seaborn:グラフ可視化ライブラリscipy, scikit-learn:統計・機械学習関連ライブラリ日本語を操る私たちにとって、世界標準なライブラリを使う際に乗り越えるべき悩みは、グラフの日本語表示の文字化け問題です。日本人の有志の方々が公開しているmatplotlib_fontjaというライブラリを導入すれば、その悩みから(ほぼ)解放されます。このライブラリはminiforgeシステムには登録されていないので、次のコマンドをターミナルで実行することで、インストールします。
python -m pip install matplotlib_fontjaコマンドを実行すると、次のようにダウンロードが自動的に始まり、matplotlib_fontjaに関連する必須ライブラリも自動的にインストールされていきます:
インストールが終わると、ターミナルの出力の下の方にSuccesfully installed ...というメッセージが表示されます。
miniforge関連の最後の作業にとりかかります。今はプロンプトに色々なコマンドを入力したり、かなり複雑なことをやっていますが、授業や研究ではプロンプトはほぼ使わず、VS Codeエディタのみの「シンプルな作業環境」を使います。VS CodeとMiniforge(Python)とRを連携させる仕組みがjupyterというライブラリです。jupyterは仮想環境(ds)をVS Codeから直接使う機能を提供します。
ターミナルが仮想環境dsにいることを確認し、次のコマンドを実行してください:
python -m ipykernel install --user --name ds --display-name "Python(ds)"ターミナルの出力にInstalled kernelspec ds in ...と表示されれば成功です。これは、仮想環境dsをVS
Codeで使う準備を行なったというメッセージです。
ここまででおそらく30-40分くらいかかったのではないかと思います。以上でPythonプログラミング環境はほぼ完成です。残りの作業は
既にRStudioでRを動かしたことがある人は、Rのインストール作業は不要です。 4.Rカーネルの設定に進んでください。
Mac版 R のインストール方法は、以下のページがとても親切です。ここに書いてある通りの手順で作業を行い、最後の動作確認まで完了してください。
https://bigdata-analytics.jp/install-tools/install_r_for_mac/
スタートボタンからRを起動します。
注意1:
Rstudioではありません。R X.Y.Z(X,Y,Zはバージョン番号)という名前のアプリです。見つからない場合は、下図のようにスタートボタンの検索でRと入力すれば出てきます。
注意2:
Rのバージョン番号は、お使いのPCによって異なります。ある人はR 4.3.3かもしれないし、別の人はR 4.5.0かもしれません。検索して複数ヒットした場合は、新しいバージョン番号の
R を選択しましょう**。
注意3:起動したRのバージョン(X.Y.Z)を忘れずに覚えておいてください。下図ではR-4.5.1を起動しています。この情報はすぐ後で使います
出現したRコンソールに、以下のコマンドを入力(またはコピペ)します。
install.packages("IRkernel")もしこのRアプリを初めて起動した人は、次のようなメッセージが出ます。
これは「外部ライブラリをネットからダウンロードしてインストールための、個人的なライブラリ置き場を設定してもよいか」という意味です。[はい(Y)]を選択します。さらに(なぜか)同じ主旨のメッセージダイアログが日本語でも出現することがあります。
ここでも同様に[はい(Y)]を選択します。
すると、Rコンソールに:
--- Please select a CRAN mirror for use in this session ---というメッセージが表示され、ダウンロード先のサーバーリスト一覧が表示された新しいウィンドウが現れることがあります。
リストの最上部にある0-Cloud[https]をマウスで選択して、[OK]ボタンをクリックしればインストール作業が再開されます。インストールに少々時間がかかって、下のような画面になればOKです。
Rは一旦終了します(作業スペースを保存しますか?とか聞かれたら、[いいえ(N)]を選択します)
再びMiniforgeプロンプトに戻ります。もしMiniforgeプロンプトを終了していたら、慌てずMiniforgeプロンプトをもう一度起動して、次のコマンドを実行し、既に作成した仮想環境「ds」に入ります。
conda activate dsさて、ここからとても大事な作業です。仮想環境 dsからさきほどRカーネルをインストールしたRのバージョンにリンクを貼ります。 そのためには、いま使っているMiniforgeプロンプト上で、さきほどのRを実行しないといけません。
Rのバージョン番号(3つ;
それぞれ仮にX,Y,Zとします)の情報を用いて、プロンプトに次のコマンドを入力します。
"c:\Program Files\R\R-X.Y.Z\bin\x64\R.exe"R-4.4.3ならば:
"c:\Program Files\R\R-4.4.3\bin\x64\R.exe"R-4.5.0ならば:
"c:\Program Files\R\R-4.5.0\bin\x64\R.exe"というコマンドをプロンプトに入力します。注意:コマンドの先頭と末尾の二重引用符"は必ずつけてください
下図の先頭行にその状況が示されています。ここではR-4.5.1のRコンソールを、仮想環境ds上で起動しています(ここがポイント)。
上の図にあるように。Rコンソールに次の2行をコピペして実行してください。
library(IRkernel)
IRkernel::installspec()実行しても何も起こりませんがそれでOKです。むしろエラーっぽい状況が発生したら、私に相談してください。
以上でminiforgeとRのリンクは確立されました。Rを終了しましょう。上図のようにRコンソールにq()[ENTER]と入力してSave workspace image? [y/n/c]と表示されるので、キーボードのnを入力すれば、Rは終了します。
https://code.visualstudio.com/ から VS Code をダウンロードします。SafariやChromeでこのWebサイトを開くと、目立つところに窓マーク+Download for Windows というリンクが見えるので、それをクリックしてインストーラーをダウンロードします。
ダウンロードしたインストーラーの「ファイルを開く」をクリックして、インストールを開始します。インストールはとても簡単で、常に[次へ/Next >]または[Install]ボタンをクリックしていけばOKです。
インストールオプションでは、
その他の4つにオプションを入れると便利です(必須ではありません)。
Windowsスタートメニューの中にVisual Studio Codeというアプリがインストールされているので、これをクリックして起動します。
VS Codeはものすごく高機能なエディタで、AIエディタ(AIと相談しながらプログラムコードを書いていく)としても活用できます。その方法はおいおい詳述するとして、ここでは日々使うプログラミングエディタとして、必須の環境設定を行います。
VS
Codeはデフォルトでは英語表示になっています。ウィンドウ左端の「拡張機能アイコン」をクリックし、検索窓にjapaneseと入力します。すると、Japanese
Language Pack for Visual Studio
Codeという拡張機能があります。これはVS
Codeの外観やメニューをできる限り日本語表示してくれます。
右下に青字に白文字で「install」というボタンがあるので、それをクリックすると、拡張機能がインストールされます。
インストールが成功すると、下のようなメッセージが表示されるので、Change Language and Restartをクリックすれば、日本語化された
VS
Codeが出現します。よく使うメニューや説明が日本語に切り替わっていることに気づくと思います。
再び機能拡張ボタンをクリックします:
出現した検索窓にPythonと入力して下さい。そして出現した拡張機能のうち、次の2つを見つけます
おそらく拡張機能Pythonをインストールすると、自動的にPylanceもインストールされるはずです。
検索窓にJupyterと入力して下さい。そして出現した拡張機能のうち、次の3つを見つけて、インストールしてください。
Jupyterをインストールすれば、自動的に他の2つもインストールされるはずです。
以上でPython+Rのプログラミング環境の基本設定は完成です!
VSCodeとターミナルを終了してOKです。